搜索资源列表
project
- 一款十分好用的网页信息抽取工具。利用了已经存在的诸如XSLT,Xquery等技术,很好地实现了基于xml/html的网页的数据抽取。-A very useful web information extraction tools. Such as the use of the already existing XSLT, Xquery and other technologies to achieve a good data based on xml/html web page extractio
Web-information-extraction-tool
- 一个网页信息抽取工具,利用了已经存在的诸如XSLT,Xquery等技术,很好地实现了基于xml/html的网页的数据抽取。-A web information extraction tools, such as the use of already existing XSLT, Xquery other technologies to achieve a good data based on xml/html web page extraction.
Web-information-extraction-tool
- 好用的网页信息抽取工具。利用了已经存在的诸如XSLT,Xquery等技术,很好地实现了基于xml/html的网页的数据抽取。-Useful Web information extraction tools. Such as the use of the already existing XSLT, Xquery and other technologies to achieve a good data based on xml/html web page extraction.
htmldownload
- 基于c++编写的http下载代码,利用winsocket实现http获取访问网页信息。可自定请求信息,和后处理解码。-Based c++ http download code written using winsocket realized gain access http web page information. Customizable request information, decoding and post-processing.
CrawlScript-bin-beta0.1
- JAVA的爬虫脚本语言:网络爬虫即自动获取网页信息的一种程序,有很多JAVA、C++的网络爬虫类库,但是在这些类库的基础上开发十分繁琐,需要大量的代码才可以完成一个简单的操作。鉴于这个问题,我们开发了Crawlscr ipt这种脚本语言,程序员只需要写2-3行简单的代码,就可以制作一个强大的网络爬虫。同时,Crawlscr ipt由JAVA编写,可以在其他JAVA程序中被简单调用。-JAVA reptiles scr ipting language: Web crawler that autom
HTTPclientPhtmlparser
- HTTPclient+htmlparser 解析网页的实例以及资料,可用于网页信息的爬取-HTTPclient+ htmlparser is use to html ......
NewsExtract
- NewsExtract 用于新浪微薄,163qq等新闻网页信息抽取,可用作数据分析 -NewsExtract for sina 163,qq or other html information Extract
WindowsFormsApplication2
- 根据关键字利用多线程抓取百度网页信息!代码简洁,程序完整。-According to the key words using multi-threaded crawling Baidu Webpage information! The code is simple, the integrity of the process.
Dongyu-Li_Project-4
- java android 系统开发,创建一个app显示五个高科技礼物,点击可显示图片,图片下面的button可以显示网页信息-java android system development, to create a high-tech app displays five gift, click to display pictures, picture below button to display the web page information
search
- 统一资源定位符(URL)是网站页面的地址判别方式,也是蜘蛛抓取网站网页信息的途径。那搜索引擎蜘蛛是如何通过URL链接抓取网站页面的呢?搜索引擎工作大致分为三个阶段:爬行和抓取阶段(搜索引擎蜘蛛访问页面,并获取页面html代码存入数据库):预处理(对页面文字进行提取、分词、消除噪音、去重 和建立索引);排名(根据页面的相关性和网站权重高低展示给用户)。-Uniform Resource Locator (URL) address discrimination is the way web page
服务器推送webim
- webim实现简单的通讯功能,用户资料查看等信息,采用长连接实现消息的接法
webobtain
- 用于网页信息的抓取,没有看到python的分类,所以分类在网络下面了,linux下可行,windows下没试-Information for web crawling, did not see the classification of python, so classified in the network below, the next viable linux, windows did not try
White.HtmlSnap
- 屏幕截屏,网页截图,屏幕录像专用工具,可用于网页信息取证等用途-Screen capture, web page screenshots, screen recording special tools for Web information forensic purposes
Spider
- 简单用C#编程语言实现的一个spider爬虫软件,可通过获取的网页源码实现爬取网页信息。-Simple to use c# programming language to realize a spider crawler software, can be achieved through access to web page source crawl web information.
l-weiwei-spiderman-master
- Spiderman 是一个基于微内核+插件式架构的网络蜘蛛,它的目标是通过简单的方法就能将复杂的目标网页信息抓取并解析为自己所需要的业务数据-Spiderman is based on a microkernel architecture+ plug-web spider, its goal is to be able to target the complex web of information to crawl and parse through a simple method for t
android
- Android的控制层开发,利用Intent实现进程间的通信,利用Intent进行Activity的跳转,以及链接网页信息。-Android development control layer, the use of Intent for communication between processes, the use of Intent conduct Activity jump, as well as links to pages of information.
sourc
- 获取网页信息,alibaba 产品信息排名-Get http info
Comein_Frame
- 穿透所有框架获取源码n捕捉真实网页信息。-Penetrate all Framework obtain source .e, capture real web page information.
Microblog
- 微博是一个很强大的网页信息交流平台,他给了我们很大的方便-Microblogging is a very powerful web platform for information exchange, he gave us a lot of convenience
ddh_v1.0
- DDH垂直搜索引擎商业版,是目前互联网中唯一可以商业运作的垂直搜索引擎系统,由JAVA语言开发,可以运行在大规模集群中的网络信息整合系统。DDH整合Nutch(开源搜索引擎系统),UCI(网页信息抽取系统)和SOLR(企业级搜索应用服务器)。无论从可扩展性,系统的性能方面还是稳定性方面,DDH垂直搜索引擎系统,都可以算的上顶级垂直搜索引擎系统之一。-DDH vertical search engine business edition, is currently the only commerc